P20

  Google MapReduce中文版 文档

摘要MapReduce是一个编程模型,也是一个处理和生成超大数据集的算法模型的相关实现。用户首先创建一个Map函数处理一个基于key/valuepair的数据集合,输出中间的基于key/value pair的数据集合;然后再创建一个Reduce函数用来合并所有的具有相同中间key值的中间value值。现实世界中有很多满足上述处理模型的例子,本论文将详细描述这个模型。

wujianhai 2011-11-26   5219   0
Go  
P20

  Google MapReduce中文版 文档

MapReduce是一个编程模型,也是一个处理和生成超大数据集的算法模型的相关实现。用户首先创建一个Map函数处理一个基于key/value pair的数据集合,输出中间的基于key/value pair的数据集合;然后再创建一个Reduce函数用来合并所有的具有相同中间key值的中间value值。现实世界中有很多满足上述处理模型的例子,本论文将详细描述这个模型。

suncf1985 2014-05-08   305   0
P19

  ASP.NET外文翻译原文 文档

ASP.NET是一个统一的Web开发模型,它包括您使用尽可能少的代码生成企业级Web应用程序所必需的各种服务。ASP.NET作为.NETFramework的一部分提供。当您编写ASP.NET应用程序的代码时,可以访问.NETFramework中的类。您可以使用与公共语言运行库(CLR)兼容的任何语言来编写应用程序的代码,这些语言包括MicrosoftVisualBasic、C#、JScript.NET和J#。

tiantinale 2014-12-16   5211   0

Google用Gloud Dataflow替代MapReduce 资讯

Google 十年前宣布了分布式大数据集处理系统 MapReduce,推动了 Hadoop 等大数据分析系统的出现。在刚刚举行的 Google I/O大会上,搜索巨人宣布了 MapReduce 的继任者 Gloud Dataflow。

jopen 2014-06-26   9184   0

Google开源C/C++版MapReduce框架 资讯

将自己用C++开发的MapReduce框架 MapReduce for C(MR4C) 开源,此举可给Hadoop社区带来福音,因为这样用户就可以在自己的Hadoop环境中运行原生的C及C++代码了。

jopen 2015-02-24   25467   0
P16

  MapReduce 的原理 文档

MapReduce的原理Hadoop中的MapReduce是一个使用简易的软件框架,基于它写出来的应用程序能够运行在由上千个商用机器组成的大型集群上,并以一种可靠容错的式并行处理上T级别的数据集。一个MapReduce作业(job)通常会把输入的数据集切分为若干独立的数据块,由map任务(task)以完全并行的方式处理它们。框架会对map的输出先进行排序,然后把结果输入给reduce任务。通常作业的输入和输出都会被存储在文件系统中。

hhy5277 2013-01-18   884   0
P16

  MapReduce 的原理 文档

MapReduce 的原理。Hadoop中的MapReduce是一个使用简易的软件框架,基于它写出来的应用程序能够运行在由上千个商用机器组成的大型集群上,并以一种可靠容错的式并行处理上T级别的数据集。一个MapReduce作业(job)通常会把输入的数据集切分为若干独立的数据块,由map任务(task)以完全并行的方式处理它们。框架会对map的输出先进行排序,然后把结果输入给reduce任务。通常作业的输入和输出都会被存储在文件系统中。整个框架负责任务的调度和监控,以及重新执行已经失败的任务。

kanmars 2012-11-05   3974   0
P19

  MapReduce与Hadoop 文档

在输入数据的“逻辑”记录上应用Map操作得出一个中间Key/value pair集合。在所有具有相同key值的value值上应用Reduce操作,从而达到合并中间的数据,得到一个想要的结果的目的

loyoo 2012-08-28   2554   0
P4

  MapReduce 实例 文档

什么是 MapReduce   Hadoop Map/Reduce是一个使用简易的软件框架,基于它写出来的应用程序能够运行在由上千个商用机器组成的大型集群上,并以一种可靠容错的方式并行处理上T级别的数据集。

singing 2014-01-09   2559   0
P16

  MapReduce的原理 文档

Hadoop中的MapReduce是一个使用简易的软件框架,基于它写出来的应用程序能够运行在由上千个商用机器组成的大型集群上,并以一种可靠容错的式并行处理上T级别的数据集。一个MapReduce作业(job)通常会把输入的数据集切分为若干独立的数据块,由map任务(task)以完全并行的方式处理它们。框架会对map的输出先进行排序,然后把结果输入给reduce任务。

banny 2014-04-09   285   0

谷歌三大核心技术(二)Google MapReduce中文版 经验

MapReduce是一个编程模型,也是一个处理和生成超大数据集的算法模型的相关实现。用户首先创建一个Map函数处理一个基于 key/value pair的数据集合,输出中间的基于key/value pair的数据集合;然后再创建一个Reduce函数用来合并所有的具有相同中间key值的中间value值。现实世界中有很多满足上述处理模型的例子, 本论文将详细描述这个模型。

fmms 2012-02-08   280103   0

为什么Google用Apache Beam彻底替换掉MapReduce 经验

近日,Apache软件基金会宣布, Apache Beam 成功孵化,成为该基金会的一个新的顶级项目,基于Apache V2许可证开源。

用MongoDB实现MapReduce 经验

MapReduce 是 Google 在 2004 年发布的一个软件框架,用于支持大规模数据的分布式计算。 MongoDB 是一个开源的面向文档的 NoSQL 数据库系统,使用 C++ 编写。

openkk 2012-02-12   63141   0

在MongoDB中使用MapReduce 经验

MapReduce是聚合工具的明星。Count、distinct、group能做的上述事情,MapReduce都能做。它是一个能轻松并行化到多个服务器的聚合方法。它会拆分问题,再将各个部分发送到不同的机器上,让每台机器都完成一部分。当所有的机器都完成的时候,再把结果汇集起来形成最终完整的结果。

jopen 2014-03-05   29621   0

Hbase基于Mapreduce的编程 经验

小试牛刀,将mapreduce的输出结果保存到大型分布式数据库中HBase中,一个例子,求各url的访问pv数据,由于用到rcfile格式需要导入hive-exce包,还需要加载hbase包,如果这两个包都已经被集群管理员放到各节点的hadoop/lib下那就可以省去这一步,废话不说,干货

openkk 2012-08-26   34241   0

MapReduce简单使用 经验

MapReduce简单使用

dgy7 2015-05-21   17403   0

MapReduce 图解流程 经验

MapReduce 图解流程

jopen 2016-01-18   12026   0
P28

  Hadoop下MapReduce编程 文档

内容:MapReduce概述,MapReduce的数据流,检查点,相关编程要点,Map过程Map过程通过在输入列表中的每一项执行函数,生成一系列的输出列表。Reduce过程Reduce过程在一个输入的列表进行扫描工作,随后生成一个聚集值,作为最后的输出MapReduce的Reduce过程所有不同的颜色代表不同的键值(keys)。

slayerlyy 2011-11-22   4450   0

MapReduce初级案例 经验

"数据去重"主要是为了掌握和利用并行化思想来对数据进行有意义的筛选。统计大数据集上的数据种类个数、从网站日志中计算访问地等这些看似庞杂的任务都会涉及数据去重。下面就进入这个实例的MapReduce程序设计。

jopen 2013-12-25   16798   0

MapReduce原理与设计思想 经验

MapReduce原理与设计思想

jopen 2014-12-04   32865   0
1 2 3 4 5 6 7 8 9 10